首页 / 技术类 / C++ / 山寨一个 Boost.Bind

山寨一个 Boost.Bind

2012-04-21 15:01:00

一直比较好奇 boost::bind 里面占位符和参数的顺序是怎么实现的,也一直看不太懂这方面源代码,昨晚好好看了下,终于有点弄懂了。小记一笔,与大家分享。

先看一个简单的用例:

 1#include <boost/bind.hpp>
 2 
 3int foo(bool a, int b, double c)
 4{
 5    return 0;
 6}
 7 
 8int main()
 9{
10    boost::bind(foo, _2, 2, _1)(3.0, true);  // foo(true, 2, 3.0)
11 
12    return 0;
13}

这里有两个步骤,第一步是绑定过程,第二步是调用。

绑定过程给出了 boost::bind 所需要的几乎所有信息——只有两个参数——_1 和 _2——的类型和值,有待确定。但是他们的顺序是确定了的,类型实际上也由函数签名所限制。bind 是一个函数,返回一个 bind_t 类型的对象,bind_t 是一个仿函数。

三个参数时 bind_t 应具备的参数信息:

参数1 参数2 参数3
占位符2 绑定值 占位符1

调用的时候给出的参数表只有两个:

参数1 参数2
值1 值2

调用时的参数匹配过程如下:

我们暂且把第二列中的参数表称为 BindList,第三列的参数表称为 CallList。BindList 和 CallList 都需要保存参数,这部分公用的东西先简单实现如下:

 1struct BindArguments0
 2{
 3 
 4};
 5 
 6template <typename A1>
 7struct BindArguments1 : public BindArguments0
 8{
 9    BindArguments1(A1 a1) : a1(a1)
10    {
11 
12    }
13 
14    A1 a1;
15};
16 
17template <typename A1, typename A2>
18struct BindArguments2 : public BindArguments1<A1>
19
20    BindArguments2(A1 a1, A2 a2) : BindArguments1(a1), a2(a2)
21    {
22 
23    }
24 
25    A2 a2;
26};
27 
28template <typename A1, typename A2, typename A3>
29struct BindArguments3 : public BindArguments2<A1, A2>
30{
31    BindArguments3(A1 a1, A2 a2, A3 a3) : BindArguments2(a1, a2), a3(a3)
32    {
33
34    }
35 
36    A3 a3;
37};

为了简洁和突出关键,我们暂时只实现到 3 个参数。从上面的代码看,多一个参数,代码是线性增长的,不是指数级增长的,所以很容易(人工地)扩充到所需要的参数个数。如果需要玩些花样,可以使用宏循环技巧自动生成代码,这部分东西在《C++ 下 Function 对象的实现(下)》中已经谈到过,本文不再赘述。

接下来实现 CallList0 到 CallList3,它除了存储参数,还具备用占位符查询出实际值的能力。占位符实现如下:

 1static struct PlaceHolder1
 2{
 3 
 4} _1;
 5 
 6static struct PlaceHolder2
 7{
 8 
 9} _2;
10 
11static struct PlaceHolder3
12{
13 
14} _3;

对,就这么简单粗暴就可以了。网上有些文章说使用 int to type,那也可以,做成这样:

1template <int i>
2struct PlaceHolder
3{
4 
5};
6 
7static PlaceHolder<1> _1;
8static PlaceHolder<2> _2;
9static PlaceHolder<3> _3;

但关键点不在这里。我们只要能对各种占位符区分类型就可以了。下文以第一个简单的定义为准。 CallList 这样子定义(灰色的先假装没看见):

 1class CallList0 : public BindArguments0
 2{
 3public:
 4    CallList0()
 5    {
 6 
 7    }
 8 
 9public:
10    template <typename T>
11    T operator [](T t)
12    {
13        return t;
14    }
15};
16 
17template <typename A1>
18class CallList1 : public BindArguments1<A1>
19{
20public:
21    CallList1(A1 a1) : BindArguments1<A1>(a1)
22    {
23 
24    }
25 
26public:
27    A1 operator [](PlaceHolder1)
28    {
29        return a1;
30    }
31 
32    template <typename T>
33    T operator [](T t)
34    {
35        return t;
36    }
37};
38 
39template <typename A1, typename A2>
40class CallList2 : public BindArguments2<A1, A2>
41{
42public:
43    CallList2(A1 a1, A2 a2) : BindArguments2<A1, A2>(a1, a2)
44    {
45 
46    }
47 
48public:
49    A1 operator [](PlaceHolder1)
50    {
51        return a1;
52    }
53 
54    A2 operator [](PlaceHolder2)
55    {
56        return a2;
57    }
58 
59    template <typename T>
60    T operator [](T t)
61    {
62        return t;
63    }
64};
65 
66template <typename A1, typename A2, typename A3>
67class CallList3: public BindArguments3<A1, A2, A3>
68{
69public:
70    CallList3(A1 a1, A2 a2, A3 a3) : BindArguments3(a1, a2, a3)
71    {
72 
73    }
74 
75public:
76    A1 operator [](PlaceHolder1)
77    {
78        return a1;
79    }
80 
81    A2 operator [](PlaceHolder2)
82    {
83        return a2;
84    }
85 
86    A3 operator [](PlaceHolder3)
87    {
88        return a3;
89    }
90 
91    template <typename T>
92    T operator [](T t)
93    {
94        return t;
95    }
96};

存储已经由 BindArguments 负责了,CallList 实现了 operator[] 用于从 PlaceHolderN 查询调用时的参数 aN。

还有一个问题,CallList 中的参数个数往往会比 BindList 中的少(其中某几个已经用实际值绑定了),这样,从 BindList 到 CallList 查询的时候,需要判断哪些是 PlaceHolder,哪些是实际参数,这就不太好操作了。为了到时候统一写法,我们让 CallList 不仅支持使用 PlaceHolder 查询,也支持使用实际参数值来查询。增加上面灰色代码,使用实际参数查询的时候,直接返回那个值。

CallList 就到此为止。现在开始实现 BindList。跟 CallList 一样,每个 BindList 都继承 BindArguments。……似乎这样就完事了?BindList 貌似没其他事情好做了。。。不过,BindList 里面保存了最原始的参数个数信息,如果我们不对函数进行萃取的话,参数个数只能从这里获取,因此调用过程只能写在这里——貌似还没说清楚,不要紧,这是后话。暂且把相关代码变灰,等下就可以看到原委了。

 1class BindList0 : public BindArguments0
 2{
 3public:
 4    BindList0()
 5    {
 6 
 7    }
 8 
 9public:
10    template <typename F, typename A>
11    void operator ()(F f, A a)
12    {
13        f();
14    }
15};
16 
17template <typename A1>
18class BindList1 : public BindArguments1<A1>
19{
20public:
21    BindList1(A1 a1) : BindArguments1<A1>(a1)
22    {
23 
24    }
25 
26public:
27    template <typename F, typename A>
28    void operator ()(F f, A a)
29    {
30        f(a[a1]);
31    }
32};
33 
34template <typename A1, typename A2>
35class BindList2 : public BindArguments2<A1, A2>
36{
37public:
38    BindList2(A1 a1, A2 a2) : BindArguments2<A1, A2>(a1, a2)
39    {
40 
41    }
42 
43public:
44    template <typename F, typename A>
45    void operator ()(F f, A a)
46    {
47        f(a[a1], a[a2]);
48    }
49};
50 
51template <typename A1, typename A2, typename A3>
52class BindList3: public BindArguments3<A1, A2, A3>
53{
54public:
55    BindList3(A1 a1, A2 a2, A3 a3) : BindArguments3(a1, a2, a3)
56    {
57 
58    }
59 
60public:
61    template <typename F, typename A>
62    void operator ()(F f, A a)
63    {
64        f(a[a1], a[a2], a[a3]);
65    }
66};

快到最后一步了。我们现在可以来考虑 Bind 的最终形式了——模版类?模板函数?从使用上来说,模版类在用的时候必须给出模版参数,想象一下这样的写法:

1bind<int (bool, int, double), PlaceHolder2, int, PlaceHolder1>(foo, _2, 2, _1)

……太没有易用性了。而模版函数则不用事先给出模版参数。boost::bind 也实现成了一组模板函数。同时,函数 Bind 返回的东西必须是可执行体,而且要包含一个BindList,C++ 里面只有仿函数能做到。这个结构我们定义为 BindT。先看代码:

 1template <typename F, typename BL>
 2class BindT
 3{
 4public:
 5    BindT(F f, BL bl) : f(f), bl(bl)
 6    {
 7 
 8    }
 9 
10public:
11    void operator ()()
12    {
13        bl(f, CallList0());
14    }
15 
16    template <typename A1>
17    void operator ()(A1 a1)
18    {
19        bl(f, CallList1<A1>(a1));
20    }
21 
22    template <typename A1, typename A2>
23    void operator ()(A1 a1, A2 a2)
24    {
25        bl(f, CallList2<A1, A2>(a1, a2));
26    }
27 
28    template <typename A1, typename A2, typename A3>
29    void operator ()(A1 a1, A2 a2, A3 a3)
30    {
31        bl(f, CallList3<A1, A2, A3>(a1, a2, a3));
32    }
33 
34private:
35    F f;
36    BL bl;
37};

BindT 保存了函数 f 以及 BindList bl。我们找一个 operator()(A1 a1) 来看,里面写成了 bl(f, CallList1(a1));,这得益于 BindList 里面实现了 operator()()。

按通常理解,可能会写成这样:

1CallList1<A1> cl(a1);

f(cl[bl.a1], cl[bl.a2], ……) 等等,bl 里面到底有几个元素?这就不知道了,因为 BindT 接受的只是一个 BindList,所以需要 BindList 给出执行形式。因此,上面 BindList 需要灰色部分的 operator()() 代码。(当然,也可以换种实现方法,抛弃 BindList,在 BindT 中将参数散开来,这看上去也是可行的。)

最后,给出一组 Bind 模版函数,作为最终使用接口:

 1template <typename F>
 2BindT<F, BindList0> Bind(F f)
 3{
 4    return BindT<F, BindList0>(f, BindList0());
 5}
 6 
 7template <typename F, typename T1>
 8BindT<F, BindList1<T1>> Bind(F f, T1 t1)
 9{
10    return BindT<F, BindList1<T1>>(f, BindList1<T1>(t1));
11}
12 
13template <typename F, typename T1, typename T2>
14BindT<F, BindList2<T1, T2>> Bind(F f, T1 t1, T2 t2)
15{
16    return BindT<F, BindList2<T1, T2>>(f, BindList2<T1, T2>(t1, t2));
17}
18 
19template <typename F, typename T1, typename T2, typename T3>
20BindT<F, BindList3<T1, T2, T3>> Bind(F f, T1 t1, T2 t2, T3 t3)
21{
22    return BindT<F, BindList3<T1, T2, T3>>(f, BindList3<T1, T2, T3>(t1, t2, t3));
23}

好了,简单实现到此为止。我们这里只是注重了参数表如何存储,如何使用占位符更改顺序,对于其他问题则没有做过多考虑。还有诸如 const/非const、有返回值/无返回值,引用/非引用、函数指针/成员函数/仿函数等问题都没有涉及。以上代码仅仅支持普通函数,不支持成员函数和仿函数。

做个简单的测试:

 1int foo0()
 2{
 3    return 0;
 4}
 5 
 6int foo1(int a)
 7{
 8    return 0;
 9}
10 
11int foo2(int a, int b)
12{
13    return 0;
14}
15 
16int foo3(int a, int b, int c)
17{
18    return 0;
19}
20 
21int main()
22{
23    Bind(foo0)();
24    Bind(foo1, _1)(1);
25    Bind(foo1, 2)();
26    Bind(foo2, _1, _2)(1, 2);
27    Bind(foo2, _2, _1)(1, 2);
28    Bind(foo2, _1, 1)(2);
29    Bind(foo2, 1, _1)(2);
30    Bind(foo2, 1, 2)();
31    Bind(foo3, _1, _2, _3)(1, 2, 3);
32    Bind(foo3, _1, _3, _2)(1, 2, 3);
33    Bind(foo3, _2, _1, _3)(1, 2, 3);
34    Bind(foo3, _2, _3, _1)(1, 2, 3);
35    Bind(foo3, _3, _1, _2)(1, 2, 3);
36    Bind(foo3, _3, _2, _1)(1, 2, 3);
37    Bind(foo3, _1, _2, 3)(1, 2);
38    Bind(foo3, _2, _1, 3)(1, 2);
39    Bind(foo3, _1, 2, 3)(1);
40 
41    return 0;
42}

将以上代码合起来(去除开头第一段代码和中间一个 PlaceHolder的代码),就是可运行的程序了。(VS2010通过)

示例程序中的各个结构与 boost::bind 实际代码的对应关系如下:

示例代码 boost
Bind bind
BindT _bi::bind_t
BindListN listN
CallListN listN
BindArgumentsN storageN
PlaceHolderN arg
BindList 和 CallList 在 boost::bind 的实现中是合并的,这是阅读时的很大干扰源。所以刚才把他们拆了讲,但愿能写明白些。

好久没发了,请各位指教。


首发:http://www.cppblog.com/Streamlet/archive/2012/04/21/172241.html



NoteIsSite/0.4